智能论文笔记

View-Disentangled Transformer for Brain Lesion Detection

Haofeng Li , Junjia Huang , Guanbin Li , Zhou Liu , Yihong Zhong , Yingying Chen , Yunfei Wang , Xiang Wan

分类：计算机视觉

2022-09-20

深度神经网络（DNN）已在脑病变检测和分割中广泛采用。但是，在2D MRI切片中定位小病变是具有挑战性的，需要在3D上下文聚集的粒度和计算复杂性之间取得平衡。在本文中，我们提出了一种新型的视角变压器，以增强MRI特征的提取，以进行更准确的肿瘤检测。首先，所提出的变压器在3D脑扫描中收获了不同位置之间的远程相关性。其次，变压器将一堆切片功能堆叠为多个2D视图，并增强这些特征的视图，该功能大致以有效的方式实现了3D相关计算。第三，我们将提出的变压器模块部署在变压器主链中，该模块可以有效地检测到脑损伤周围的2D区域。实验结果表明，我们提出的观看式变压器在具有挑战性的大脑MRI数据集上对大脑病变检测表现良好。

translated by 谷歌翻译

MSA-GCN:Multiscale Adaptive Graph Convolution Network for Gait Emotion Recognition

Yunfei Yin , Li Jing , Faliang Huang , Guangchao Yang , Zhuowei Wang

分类：计算机视觉 | 机器学习

2022-09-19

步态情绪识别在智能系统中起着至关重要的作用。大多数现有方法通过随着时间的推移专注于当地行动来识别情绪。但是，他们忽略了时间域中不同情绪的有效距离是不同的，而且步行过程中的当地行动非常相似。因此，情绪应由全球状态而不是间接的本地行动代表。为了解决这些问题，这项工作通过构建动态的时间接受场并设计多尺度信息聚集以识别情绪，从而在这项工作中介绍了新型的多量表自适应图卷积网络（MSA-GCN）。在我们的模型中，自适应选择性时空图卷积旨在动态选择卷积内核，以获得不同情绪的软时空特征。此外，跨尺度映射融合机制（CSFM）旨在构建自适应邻接矩阵，以增强信息相互作用并降低冗余。与以前的最先进方法相比，所提出的方法在两个公共数据集上实现了最佳性能，将地图提高了2 \％。我们还进行了广泛的消融研究，以显示不同组件在我们的方法中的有效性。

translated by 谷歌翻译

Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning

Yunfei Li , Tian Gao , Jiaqi Yang , Huazhe Xu , Yi Wu

分类：机器学习 | 人工智能

2022-06-24

将监督学习的力量（SL）用于更有效的强化学习（RL）方法，这是最近的趋势。我们通过交替在线RL和离线SL来解决稀疏奖励目标条件问题，提出一种新颖的阶段方法。在在线阶段，我们在离线阶段进行RL培训并收集推出数据，我们对数据集的这些成功轨迹执行SL。为了进一步提高样本效率，我们在在线阶段采用其他技术，包括减少任务以产生更可行的轨迹和基于价值的基于价值的内在奖励，以减轻稀疏的回报问题。我们称此总体算法为阶段性的自我模拟还原（Pair）。对稀疏的奖励目标机器人控制问题（包括具有挑战性的堆叠任务），对基本上优于非强调RL和Phasic SL基线。 Pair是第一个学习堆叠6个立方体的RL方法，只有0/1成功从头开始奖励。

translated by 谷歌翻译

Universality and approximation bounds for echo state networks with random weights

Zhen Li , Yunfei Yang

分类：机器学习 | 神经与进化计算 | (统计)机器学习

2022-06-12

我们研究具有随机生成内部权重的回声状态网络的均匀近似。这些模型在训练过程中仅优化了读数权重，在学习动态系统方面取得了经验成功。我们通过证明它们在弱条件下是普遍的来解决这些模型的代表性。我们的主要结果为激活函数提供了足够的条件和内部权重的采样过程，因此回声状态网络可以近似具有高概率的任何连续的休闲时间不变的操作员。特别是，对于Relu激活，我们量化了足够常规运算符的回声状态网络的近似误差。

translated by 谷歌翻译

A Benchmark for Low-Switching-Cost Reinforcement Learning

Shusheng Xu , Yancheng Liang , Yunfei Li , Simon Shaolei Du , Yi Wu

分类：机器学习

2021-12-13

许多实际强化学习（RL）应用中的无处不在的要求，包括医疗，建议制度，教育和机器人，是实际与环境互动的部署政策无法频繁变化。这种RL设置称为低交换成本RL，即，实现最高奖励，同时在培训期间减少策略交换机的数量。尽管最近旨在设计具有低开关成本的可透明的RL算法的理论研究的趋势，但在流行的RL试验台中没有任何现有方法已经完全评估。在本文中，我们系统地研究了广泛的策略切换方法，包括理论上的标准，基于政策差异的方法和非自适应基线。通过对医疗环境的大量实验，Atari Games和机器人控制任务，我们为低交换成本RL提供了第一个实证基准，并在如何降低交换成本的同时对其进行相似的样本效率来报告新的调查结果没有低切换成本约束的情况。我们希望该基准测试可以作为开发更实际有效的低开关成本RL算法的起点。我们在https://sites.google.com/view/low-switching-cost-rl中发布了我们的代码和完成结果。

translated by 谷歌翻译

ShufaNet: Classification method for calligraphers who have reached the professional level

Ge Yunfei , Diao Changyu , Li Min , Yu Ruohan , Qiu Linshan , Xu Duanqing

分类：计算机视觉

2021-11-22

书法的真实性是艺术领域中的重要而艰巨的任务，其中关键问题是书法的几次拍摄分类。我们提出了一种新的方法，Shufanet（“Shufa”是中国书法的拼音），在几次射击的情况下，根据公制学习对中国书法的款式进行分类，其分类准确性超过了书法专业的学生水平。我们提出了一种新的网络架构，包括称为Shufaloss的手写字体样式的独特表达，以及作为先验知识的书法类别信息。同时，我们修改了空间关注模块，并根据传统九宫思想为手写字体创建了Shufaittent。对于模型的培训，我们构建了一个书法的数据集。我们的方法在我们的数据集中实现了65％的准确率，用于几次拍摄的学习，超越Reset和其他主流CNN。与此同时，我们为书法主要学生进行了战斗，最后超越了他们。这是第一次在书法家分类领域深入学习的尝试，我们希望为后续研究提供思路。

translated by 谷歌翻译

Approximation in shift-invariant spaces with deep ReLU neural networks

Yunfei Yang , Zhen Li , Yang Wang

分类：机器学习 | (统计)机器学习

2020-05-25

我们研究了深层神经网络的表达能力，以在扩张的转移不变空间中近似功能，这些空间被广泛用于信号处理，图像处理，通信等。相对于神经网络的宽度和深度估算了近似误差界限。网络构建基于深神经网络的位提取和数据拟合能力。作为我们主要结果的应用，获得了经典函数空间（例如Sobolev空间和BESOV空间）的近似速率。我们还给出了$ l^p（1 \ le p \ le \ infty）$近似误差的下限，这表明我们的神经网络的构建是渐近的最佳选择，即最大程度地达到对数因素。

translated by 谷歌翻译

Linear features segmentation from aerial images

Zhipeng Chang , Siddharth Jha , Yunfei Xia

分类：计算机视觉 | 人工智能

2022-12-23

The rapid development of remote sensing technologies have gained significant attention due to their ability to accurately localize, classify, and segment objects from aerial images. These technologies are commonly used in unmanned aerial vehicles (UAVs) equipped with high-resolution cameras or sensors to capture data over large areas. This data is useful for various applications, such as monitoring and inspecting cities, towns, and terrains. In this paper, we presented a method for classifying and segmenting city road traffic dashed lines from aerial images using deep learning models such as U-Net and SegNet. The annotated data is used to train these models, which are then used to classify and segment the aerial image into two classes: dashed lines and non-dashed lines. However, the deep learning model may not be able to identify all dashed lines due to poor painting or occlusion by trees or shadows. To address this issue, we proposed a method to add missed lines to the segmentation output. We also extracted the x and y coordinates of each dashed line from the segmentation output, which can be used by city planners to construct a CAD file for digital visualization of the roads.

translated by 谷歌翻译

Discriminative feature encoding for intrinsic image decomposition

Zongji Wang , Yunfei Liu , Feng Lu

分类：计算机视觉

2022-09-25

固有的图像分解是一个重要且长期存在的计算机视觉问题。给定输入映像，恢复物理场景属性的定位不足。几个出于身体动机的先验已被用来限制固有图像分解的优化问题的解决方案空间。这项工作利用了深度学习的优势，并表明它可以以高效率解决这个具有挑战性的计算机视觉问题。焦点在于特征编码阶段，从输入图像中提取不同固有层的区分特征。为了实现这一目标，我们探讨了高维特征嵌入空间中不同内在组件的独特特性。我们定义特征分布差异，以有效地分离不同内在组件的特征向量。功能分布也受到限制，以通过特征分布一致性符合真实的分布。此外，还提供了一种数据完善方法来消除Sintel数据集中的数据不一致，使其更适合固有图像分解。我们的方法还扩展到基于相邻帧之间像素的对应关系的固有视频分解。实验结果表明，我们提出的网络结构可以胜过现有的最新最新。

translated by 谷歌翻译

Modeling Diverse Chemical Reactions for Single-step Retrosynthesis via Discrete Latent Variables

Huarui He , Jie Wang , Yunfei Liu , Feng Wu

分类：机器学习

2022-08-10

单步反转合作是逆合合成计划的基石，这是计算机辅助药物发现的至关重要的任务。单步回合合成的目的是确定导致一个反应中靶产物合成的可能反应物。通过将有机分子表示为规范串，现有的基于序列的折叠方法将乘积 - 反应性逆合合成视为序列到序列翻译问题。但是，由于确定性推断，他们中的大多数人都难以识别所需产物的多种化学反应，这与以下事实相矛盾：许多化合物可以通过各种反应类型与不同的反应物组成。在这项工作中，我们旨在增加反应多样性并使用离散的潜在变量产生各种反应物。我们提出了一种基于序列的新方法，即RetrodVcae，该方法将条件变分自动化码器纳入单步回逆转录中，并将离散的潜在变量与生成过程相关联。具体而言，RetroDVCAE使用Gumbel-Softmax分布来近似于潜在反应的分类分布，并生成与变异解码器的多组反应物。实验表明，RetroDVCAE在基准数据集和自制数据集上的最先进基准均优于最先进的基线。定量和定性结果都表明，转化vcae可以在反应类型上对多模式分布进行建模，并产生各种反应物候选物。

translated by 谷歌翻译